home *** CD-ROM | disk | FTP | other *** search
/ Chip 1996 April / CHIP 1996 aprilis (CD06).zip / CHIP_CD06.ISO / hypertxt.arj / 92 / GOCRTEZ0.CD < prev    next >
Text File  |  1995-09-14  |  10KB  |  164 lines

  1.       @VKedves (szövegbe)olvasó!@N
  2.  
  3.       @VGO-CR 2.0@N
  4.  
  5.           Az OCR programok világpiaca manapság még nem túl bô, így
  6.       tehát érthetô  érdeklôdéssel, sôt  -- ismerve  az elôdöt  --
  7.       talán  némiképpen  túlzott  várakozással  néztem  az  ismert
  8.       Recognita Plus 2.0 kistestvére, a GO-CR 2.0 tesztje elé.
  9.           Hozzá kell  tennem, hogy  a GO-CR  korábbi, 1.2 verziója
  10.       ismeretlen  volt számomra,  így csupán  a Recognita  erényei
  11.       alapján  közelítettem  az  új  szoftverhez.  De  lássuk   az
  12.       eredményt.
  13.           A  GO-CR  ízléses,  a  lemezeket  jól  védô,  bár  kissé
  14.       túlméretezett kartondobozban kapott helyet a dokumentáció és
  15.       némi  reklám  társaságában. Az  5|1/4  colos lemez  tartalma
  16.       Windows alól telepíthetô,  minden nehézség nélkül.  Teljesen
  17.       kezdô felhasználó a dokumentáció alapján, annak  utasításait
  18.       követve  percek  alatt  használható  állapotba  hozhatja   a
  19.       szoftvert.  Nagyobb   nehézséget  jelenthet   a  kéziscanner
  20.       telepítése, de  a teszt  során használt  Logitech Scanman 32
  21.       típust a  leírás alapján  szintén igen  egyszerû mûködôképes
  22.       állapotba hozni.
  23.           A  munka  megkezdéséhez már  csak  egyetlen lépést  kell
  24.       megtenni. A GO-CR opciók  menüjében a paraméterek között  be
  25.       kell állítani a scannertípust.
  26.           A  GO-CR program  használatának megtanulásához  pontosan
  27.       annyi idôre van szükség, amennyi idô alatt el tudjuk olvasni
  28.       a   dokumentációt.   A   szoftver   feltétlen   elônye    az
  29.       áttekinthetôség,   amelyhez   meglehetôsen   jól    sikerült
  30.       menüpontok   és   feladatmegnevezések   társulnak.   Itt   a
  31.       Windows-alapú   rendszerekben   megszokott   és   a  legtöbb
  32.       gyakorlott felhasználót irritáló ""mindjárt megcsinálom,  ha
  33.       elôbb kattintgatsz néhányat"  megoldása sem zavaró,  mivel a
  34.       menüpontok célratörô egyszerûséggel szervezettek.
  35.           Hasonlóan   jól  sikerült   a  felhasználói   kézikönyv,
  36.       amelynek    szerkezete,    egyszerû,    célratörôen    tömör
  37.       fogalmazása,   áttekinthetôsége    és   a    szövegrészletek
  38.       kiemelésének következetes  alkalmazása nagyban  hozzájárul a
  39.       gyors   megtanulhatósághoz.  A   teljes  kézikönyvnek   csak
  40.       egyetlen megfogalmazásával nem tudok egyetérteni, de  sajnos
  41.       ez  a lényeget  érinti. Ez  a kézikönyv  alcímében  szereplô
  42.       megjegyzés,  miszerint  a  GO-CR  ""ideális  szövegfelismerô
  43.       program  kézi  szkennerekhez". Kétségtelenül  igaz,  hogy az
  44.       ""ideális" jelzô sokféleképpen, akár filozófikus tartalommal
  45.       is érthetô,  mégis úgy  vélem, manapság  egy ilyen  jelzôvel
  46.       ellátott  szövegfelismerô programtól  elvárható lenne,  hogy
  47.       segítségével hatékonyabban lehessen a beolvasott  szövegeket
  48.       eltárolni,  mint  úgy,  hogy  a  számítógépet  ""írógépként"
  49.       alkalmazzuk,     és     a     szöveget     begépeljük    egy
  50.       szövegszerkesztôbe. Igaz, aki lassan gépel és sok ideje van,
  51.       nem érzi ezt kritikusnak.
  52.           Lássuk  a  száraz  tényeket.  A  GO-CR  valószínûleg nem
  53.       rendelkezik  kellôen   hatékony  képjavító   eljárásokkal  a
  54.       beszkennelt   oldalak   bitképének   elôkészítéséhez,  pedig
  55.       ilyenekre éppen a  kéziscannerek használatakor lenne  igazán
  56.       szükség,   hiszen   a  felhasználó   keze   semmiképpen  sem
  57.       tekinthetô sebesség-  és iránystabilizáltnak,  így várhatóan
  58.       --  sôt egészen  biztosan --  egyenetlen lesz  a  beolvasott
  59.       bitkép. Ezután kerül  a bitkép a  szövegfelismerô algoritmus
  60.       gondjaiba, amely a beolvasott anyag elég sok részletével nem
  61.       tud mit kezdeni,  s a bizakodó  felhasználót egész sor  ""~"
  62.       jellel  kápráztatja  el, bár  a  karakterfelismerés abszolút
  63.       értékben eredményesnek tekinthetô.
  64.           Nehézséget  okoz,  hogy a  kéziscannert  a sorokra  vagy
  65.       merôlegesen  (balról-jobbra   olvasás),  vagy   párhuzamosan
  66.       (felülrôl-lefelé  olvasás)  kellene  tartani  ahhoz,  hogy a
  67.       sorok   ne   keveredjenek   össze.   Ez   összességében  azt
  68.       eredményezi, hogy a felismert szöveg összetöredezhet, sôt  a
  69.       beolvasás  elôtt  beállított  kétoldali  vágás  ellenére   a
  70.       szövegben  bennmaradó   töredék  sorok   tovább  rontják   a
  71.       keletkezô szövegfile kezelhetôségét. îgy elôfordulhat,  hogy
  72.       a felhasználni  kívánt szövegben  ugyan jó  lesz a felismert
  73.       karakterek abszolút száma a beolvasott karakterekhez képest,
  74.       a  felhasználó mégis  úgy érzi,  igen sokat  kell  dolgoznia
  75.       ahhoz, hogy  a töredék  sorok törlése  és a  tördelési hibák
  76.       kijavítása  után  végre hozzáláthasson  a  hibásan felismert
  77.       karakterek javításához.
  78.           Tapasztalatom szerint a beolvasás elfogadható  hibaarány
  79.       mellett  csak  sík  lapról  történhet.  Könyvbôl  beolvasott
  80.       anyagnál   a  szövegfelismerés   az  óhatatlanul   létrejövô
  81.       geometriai torzítások miatt meglehetôsen sok hibával jár.
  82.           A  GO-CR  igen  sokféle  nemzeti  karakterkészlettel van
  83.       ellátva,  ami azt  sugallja, hogy  alkalmazható lenne  rövid
  84.       ideig  rendelkezésre  álló  anyagok  gyors  beolvasására   a
  85.       késôbbi  hibajavítás  céljára.  Sajnos  a  tapasztalat   azt
  86.       mutatja,  hogy  az  elmentett anyag  még  magyar  nyelven is
  87.       nehezen javítható, de  a javítás biztonsága  semmiképpen sem
  88.       lehet 100%-os az eredeti hiányában, ha annak tartalma,  vagy
  89.       megfogalmazása eltér a köznyelvi általánosságoktól.
  90.           Tesztszövegként a HVG 1992. június 20-i számában, a  21.
  91.       oldalon megjelent ""Jelenetek  egy háborúból" címû  írást, a
  92.       GO-CR  felhasználói  kézikönyvének  3--11.  oldalát,   angol
  93.       nyelvû szövegként pedig a Microsoft Pascal 4.0 User's  Guide
  94.       3. oldalát (kapcsos  dossziéból laponként kiemelhetô,  tehát
  95.       sík lapon olvasható) választottam, mivel több kísérlet  után
  96.       ez utóbbi adta a leginkább elfogadható eredményt. A  scanner
  97.       optimális szürke-fekete tónusbeállítása után (öt  beolvasási
  98.       kísérlet  eredménye  alapján)  a  szöveg  300  és  400   dpi
  99.       felbontásban  került   beolvasásra,  majd   az  így   kapott
  100.       szövegfile    rendezés,    ""fazonigazítás"    után   került
  101.       összehasonlításra az eredetivel.
  102.           A HVG cikk 300 dpi-s  szkennelése után a két hasáb  2618
  103.       illetve 2694 karakterébôl 106 illetve 105 hibásan  felismert
  104.       karakter  adódott,  ami elég  jó,  4%-os hibaarányt  jelent.
  105.       Ugyanitt  400  dpi-s  szkennelés  után  100  és  72  hibásan
  106.       felismert  karaktert   kaptunk,  ami   4,  illetve   2,8%-os
  107.       hibaarányt  jelent.  Hasonló  arányt  kaptunk  a  Pascal 4.0
  108.       User's Guide és a GO-CR felhasználói kézikönyv lapjainál is.
  109.           Az itt említett  jó eredmény szépségébôl  némiképp levon
  110.       az a tény, hogy ilyen eredményhez optimális feltételekre van
  111.       szükség,  tehát  a  scannert  valamilyen  eszközzel célszerû
  112.       ""vezetni" és  a beolvasást  igen figyelmesen  kell végezni,
  113.       különös  tekintettel   a  mozgás   egyenletességére.  Vagyis
  114.       pihenten dolgozzunk, és hosszabb anyag bevitelekor iktassunk
  115.       be pihenôket és kéztornát, mivel a negyedik oldal beolvasása
  116.       után rohamosan  romlik a  felismert karakterek  aránya. Elsô
  117.       kísérleteim   során   teljesen   elkedvetlenített,   hogy  a
  118.       felismert szöveg fele sem volt használható.
  119.           Végül álljon itt néhány gondolatébresztô költôi kérdés a
  120.       fejlesztôk  számára.  A GO-CR  miért  nem képes  bittérképes
  121.       file-ok beolvasására,  hiszen ekkor  a beolvasott  anyagokat
  122.       képjavító eljárások alkalmazása után, késôbb is alá  lehetne
  123.       vetni a  szövegfelismerés eljárásának.  Ha ez  nem cél,  nem
  124.       kellene-e javítani a szoftver saját képjavító  algoritmusán,
  125.       hiszen   egy   gyengébb   scanner   alkalmazásakor  fokozott
  126.       érzékenységû   lesz   a   rendszer   a   papírminôségre,   a
  127.       karaktertípusra.  Színes   oldalak  szövegeinek   beolvasása
  128.       gyakorlatilag  lehetetlen  (halvány  pasztell  háttér esetén
  129.       esetleg kísérletezhetünk,  de csak  abban az  esetben, ha  a
  130.       háttér egyenletes).
  131.           Végkövetkeztetés: a  GO-CR olcsó,  de csak  szûk keretek
  132.       között  használható eredményesen.  Tekintsük tehát  ígéretes
  133.       kezdetnek, és reménykedjünk a késôbbi fejlesztésekben.
  134.  
  135.       @KBerényi Csaba@N
  136.  
  137.  
  138.       @VMit mondanak a fejlesztôk?@N
  139.  
  140.           A teszt során felvetôdött problémák tisztázása érdekében
  141.       megkerestük az SzKI Recognita Rt.-t. Dr. Balázs-Piri  László
  142.       igazgató úr szívességébôl a cég munkatársainak kiegészítését
  143.       rövid idôn belül  megkaptuk. Ennek lényegét  pontokba szedve
  144.       közöljük:
  145.           @V*@N   a    GO-CR   elsôsorban    keskenyhasábos   szövegek
  146.       beolvasásához ajánlott szoftver;
  147.           @V*@N a valósidejû  megjelenítés a GO-CR  olyan, újdonságnak
  148.       számító  szolgáltatása,  amely   segíti  a  felhasználót   a
  149.       szürkeárnyalat optimális beállításában a scanneren;
  150.           @V*@N  a  GO-CR  @KText--Merge@N  szolgáltatása  lehetôséget  ad
  151.       hosszabb szövegek egybefüggô bevitelére;
  152.           @V*@N   a   kimentett  szövegfile   bármely   Windows  alapú
  153.       szövegszerkesztôbe     nehézség     nélkül,    automatikusan
  154.       beolvasható és ott tovább szerkeszthetô;
  155.           @V*@N   a   szomszédos   hasábok   beolvasásakor   keletkezô
  156.       felesleges karakterek képkijelöléssel megszüntethetôk --  ha
  157.       a  beolvasás  során  a  beolvasni  kívánt  hasáb  kijelölése
  158.       önmagában nem vezetne kellô eredményre;
  159.           @V*@N a  scannervezetés ""kézfüggô",  ezért a  kéziscannerek
  160.       közül érdemes  kiegészítô vezetôgörgôvel  ellátott típusokat
  161.       használni, mivel így kisebb a hibalehetôség;
  162.           @V*@N idôközben elkészült a magyar nyelvû súgó (help), amely
  163.       segíti a magyar felhasználók munkáját.
  164.